#!/bin/bash

./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 192 -k 384 --alpha 1 --a_type f32_r --lda 1225 --stride_a 470400 --b_type f32_r --ldb 384 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 235200 --d_type f32_r --ldd 1225 --stride_d 235200 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 32 -k 192 --alpha 1 --a_type f32_r --lda 1225 --stride_a 235200 --b_type f32_r --ldb 192 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 39200 --d_type f32_r --ldd 1225 --stride_d 39200 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 48 -k 192 --alpha 1 --a_type f32_r --lda 1225 --stride_a 235200 --b_type f32_r --ldb 192 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 58800 --d_type f32_r --ldd 1225 --stride_d 58800 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 48 -k 256 --alpha 1 --a_type f32_r --lda 1225 --stride_a 313600 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 58800 --d_type f32_r --ldd 1225 --stride_d 58800 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 48 -k 288 --alpha 1 --a_type f32_r --lda 1225 --stride_a 352800 --b_type f32_r --ldb 288 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 58800 --d_type f32_r --ldd 1225 --stride_d 58800 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 64 -k 192 --alpha 1 --a_type f32_r --lda 1225 --stride_a 235200 --b_type f32_r --ldb 192 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 78400 --d_type f32_r --ldd 1225 --stride_d 78400 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 64 -k 256 --alpha 1 --a_type f32_r --lda 1225 --stride_a 313600 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 78400 --d_type f32_r --ldd 1225 --stride_d 78400 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 64 -k 288 --alpha 1 --a_type f32_r --lda 1225 --stride_a 352800 --b_type f32_r --ldb 288 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 78400 --d_type f32_r --ldd 1225 --stride_d 78400 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 64 -k 384 --alpha 1 --a_type f32_r --lda 1225 --stride_a 470400 --b_type f32_r --ldb 384 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 78400 --d_type f32_r --ldd 1225 --stride_d 78400 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 1225 -n 96 -k 384 --alpha 1 --a_type f32_r --lda 1225 --stride_a 470400 --b_type f32_r --ldb 384 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 117600 --d_type f32_r --ldd 1225 --stride_d 117600 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 289 -n 128 -k 1024 --alpha 1 --a_type f32_r --lda 289 --stride_a 295936 --b_type f32_r --ldb 1024 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 36992 --d_type f32_r --ldd 289 --stride_d 36992 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 289 -n 128 -k 768 --alpha 1 --a_type f32_r --lda 289 --stride_a 221952 --b_type f32_r --ldb 768 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 36992 --d_type f32_r --ldd 289 --stride_d 36992 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 289 -n 160 -k 768 --alpha 1 --a_type f32_r --lda 289 --stride_a 221952 --b_type f32_r --ldb 768 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 46240 --d_type f32_r --ldd 289 --stride_d 46240 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 289 -n 192 -k 1024 --alpha 1 --a_type f32_r --lda 289 --stride_a 295936 --b_type f32_r --ldb 1024 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 55488 --d_type f32_r --ldd 289 --stride_d 55488 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 289 -n 192 -k 768 --alpha 1 --a_type f32_r --lda 289 --stride_a 221952 --b_type f32_r --ldb 768 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 55488 --d_type f32_r --ldd 289 --stride_d 55488 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 289 -n 256 -k 1024 --alpha 1 --a_type f32_r --lda 289 --stride_a 295936 --b_type f32_r --ldb 1024 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 73984 --d_type f32_r --ldd 289 --stride_d 73984 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 289 -n 384 -k 1024 --alpha 1 --a_type f32_r --lda 289 --stride_a 295936 --b_type f32_r --ldb 1024 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 110976 --d_type f32_r --ldd 289 --stride_d 110976 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 5329 -n 64 -k 160 --alpha 1 --a_type f32_r --lda 5329 --stride_a 852640 --b_type f32_r --ldb 160 --stride_b 0 --beta 0 --c_type f32_r --ldc 5329 --stride_c 341056 --d_type f32_r --ldd 5329 --stride_d 341056 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 5329 -n 80 -k 64 --alpha 1 --a_type f32_r --lda 5329 --stride_a 341056 --b_type f32_r --ldb 64 --stride_b 0 --beta 0 --c_type f32_r --ldc 5329 --stride_c 426320 --d_type f32_r --ldd 5329 --stride_d 426320 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0

./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 192 -k 32 --alpha 1 --a_type f32_r --lda 1225 --stride_a 39200 --b_type f32_r --ldb 192 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 235200 --d_type f32_r --ldd 1225 --stride_d 235200 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 192 -k 48 --alpha 1 --a_type f32_r --lda 1225 --stride_a 58800 --b_type f32_r --ldb 192 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 235200 --d_type f32_r --ldd 1225 --stride_d 235200 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 192 -k 64 --alpha 1 --a_type f32_r --lda 1225 --stride_a 78400 --b_type f32_r --ldb 192 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 235200 --d_type f32_r --ldd 1225 --stride_d 235200 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 256 -k 48 --alpha 1 --a_type f32_r --lda 1225 --stride_a 58800 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 313600 --d_type f32_r --ldd 1225 --stride_d 313600 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 256 -k 64 --alpha 1 --a_type f32_r --lda 1225 --stride_a 78400 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 313600 --d_type f32_r --ldd 1225 --stride_d 313600 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 288 -k 48 --alpha 1 --a_type f32_r --lda 1225 --stride_a 58800 --b_type f32_r --ldb 288 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 352800 --d_type f32_r --ldd 1225 --stride_d 352800 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 288 -k 64 --alpha 1 --a_type f32_r --lda 1225 --stride_a 78400 --b_type f32_r --ldb 288 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 352800 --d_type f32_r --ldd 1225 --stride_d 352800 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 384 -k 192 --alpha 1 --a_type f32_r --lda 1225 --stride_a 235200 --b_type f32_r --ldb 384 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 470400 --d_type f32_r --ldd 1225 --stride_d 470400 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 384 -k 64 --alpha 1 --a_type f32_r --lda 1225 --stride_a 78400 --b_type f32_r --ldb 384 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 470400 --d_type f32_r --ldd 1225 --stride_d 470400 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 1225 -n 384 -k 96 --alpha 1 --a_type f32_r --lda 1225 --stride_a 117600 --b_type f32_r --ldb 384 --stride_b 0 --beta 0 --c_type f32_r --ldc 1225 --stride_c 470400 --d_type f32_r --ldd 1225 --stride_d 470400 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 289 -n 1024 -k 128 --alpha 1 --a_type f32_r --lda 289 --stride_a 36992 --b_type f32_r --ldb 1024 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 295936 --d_type f32_r --ldd 289 --stride_d 295936 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 289 -n 1024 -k 192 --alpha 1 --a_type f32_r --lda 289 --stride_a 55488 --b_type f32_r --ldb 1024 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 295936 --d_type f32_r --ldd 289 --stride_d 295936 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 289 -n 1024 -k 256 --alpha 1 --a_type f32_r --lda 289 --stride_a 73984 --b_type f32_r --ldb 1024 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 295936 --d_type f32_r --ldd 289 --stride_d 295936 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 289 -n 1024 -k 384 --alpha 1 --a_type f32_r --lda 289 --stride_a 110976 --b_type f32_r --ldb 1024 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 295936 --d_type f32_r --ldd 289 --stride_d 295936 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 289 -n 768 -k 128 --alpha 1 --a_type f32_r --lda 289 --stride_a 36992 --b_type f32_r --ldb 768 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 221952 --d_type f32_r --ldd 289 --stride_d 221952 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 289 -n 768 -k 160 --alpha 1 --a_type f32_r --lda 289 --stride_a 46240 --b_type f32_r --ldb 768 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 221952 --d_type f32_r --ldd 289 --stride_d 221952 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 289 -n 768 -k 192 --alpha 1 --a_type f32_r --lda 289 --stride_a 55488 --b_type f32_r --ldb 768 --stride_b 0 --beta 0 --c_type f32_r --ldc 289 --stride_c 221952 --d_type f32_r --ldd 289 --stride_d 221952 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 5329 -n 160 -k 64 --alpha 1 --a_type f32_r --lda 5329 --stride_a 341056 --b_type f32_r --ldb 160 --stride_b 0 --beta 0 --c_type f32_r --ldc 5329 --stride_c 852640 --d_type f32_r --ldd 5329 --stride_d 852640 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 5329 -n 64 -k 80 --alpha 1 --a_type f32_r --lda 5329 --stride_a 426320 --b_type f32_r --ldb 64 --stride_b 0 --beta 0 --c_type f32_r --ldc 5329 --stride_c 341056 --d_type f32_r --ldd 5329 --stride_d 341056 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 1280 -k 192 --alpha 1 --a_type f32_r --lda 64 --stride_a 12288 --b_type f32_r --ldb 1280 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 81920 --d_type f32_r --ldd 64 --stride_d 81920 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 1280 -k 320 --alpha 1 --a_type f32_r --lda 64 --stride_a 20480 --b_type f32_r --ldb 1280 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 81920 --d_type f32_r --ldd 64 --stride_d 81920 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 1280 -k 384 --alpha 1 --a_type f32_r --lda 64 --stride_a 24576 --b_type f32_r --ldb 1280 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 81920 --d_type f32_r --ldd 64 --stride_d 81920 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 1280 -k 448 --alpha 1 --a_type f32_r --lda 64 --stride_a 28672 --b_type f32_r --ldb 1280 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 81920 --d_type f32_r --ldd 64 --stride_d 81920 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 1536 -k 256 --alpha 1 --a_type f32_r --lda 64 --stride_a 16384 --b_type f32_r --ldb 1536 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 98304 --d_type f32_r --ldd 64 --stride_d 98304 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 1536 -k 384 --alpha 1 --a_type f32_r --lda 64 --stride_a 24576 --b_type f32_r --ldb 1536 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 98304 --d_type f32_r --ldd 64 --stride_d 98304 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 2048 -k 192 --alpha 1 --a_type f32_r --lda 64 --stride_a 12288 --b_type f32_r --ldb 2048 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 131072 --d_type f32_r --ldd 64 --stride_d 131072 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 2048 -k 320 --alpha 1 --a_type f32_r --lda 64 --stride_a 20480 --b_type f32_r --ldb 2048 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 131072 --d_type f32_r --ldd 64 --stride_d 131072 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 2048 -k 384 --alpha 1 --a_type f32_r --lda 64 --stride_a 24576 --b_type f32_r --ldb 2048 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 131072 --d_type f32_r --ldd 64 --stride_d 131072 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 64 -n 2048 -k 448 --alpha 1 --a_type f32_r --lda 64 --stride_a 28672 --b_type f32_r --ldb 2048 --stride_b 0 --beta 0 --c_type f32_r --ldc 64 --stride_c 131072 --d_type f32_r --ldd 64 --stride_d 131072 --batch 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
